23 research outputs found

    CẢI THIỆN THUẬT GIẢI CUCKOO TRONG VẤN ĐỀ ẨN LUẬT KẾT HỢP

    Get PDF
    Nowadays, the problem of data security in the process of data mining receives more attention. The question is how to balance between exploiting legal data and avoiding revealing sensitive information. There have been many approaches, and one remarkable approach is privacy preservation in association rule mining to hide sensitive rules. Recently, a meta-heuristic algorithm is relatively effective for this purpose, which is cuckoo optimization algorithm (COA4ARH). In this paper, an improved version of COA4ARH is presented for calculating the minimum number of sensitive items which should be removed to hide sensitive rules, as well as limit the loss of non-sensitive rules. The experimental results gained from three real datasets showed that the proposed method has better results compared to the original algorithm in several cases.Hiện nay, vấn đề bảo mật dữ liệu ngày càng được quan tâm hơn trong quá trình khai thác dữ liệu. Làm sao để vừa có thể khai thác hợp pháp mà vừa tránh lộ ra các thông tin nhạy cảm. Có rất nhiều hướng tiếp cận nhưng nổi trội trong số đó là khai thác luật kết hợp đảm bảo sự riêng tư nhằm ẩn các luật nhạy cảm. Gần đây, có một thuật toán meta heuristic khá hiệu quả để đạt mục đích này, đó là thuật toán tối ưu hóa Cuckoo (COA4ARH). Trong bài báo này, một đề xuất cải tiến của COA4ARH được đưa ra để tính toán số lượng tối thiểu các item nhạy cảm cần được xóa để ẩn luật, từ đó hạn chế việc mất các luật không nhạy cảm. Các kết quả thực nghiệm tiến hành trên ba tập dữ liệu thực cho thấy trong một số trường hợp thì cải tiến đề xuất có kết quả khá tốt so với thuật toán ban đầu

    MAXLEN-FI: THUẬT TOÁN KHAI THÁC NHANH TẬP PHỔ BIẾN CÓ CHIỀU DÀI TỐI ĐA TRÊN DỮ LIỆU GIAO DỊCH

    Get PDF
    Association rule mining, one of the most important and well-researched techniques of data mining. Mining frequent itemsets are one of the most fundamental and most time-consuming problems in association rule mining. However, real-world applications are often sufficient to mine a small representative subset of frequent itemsets with low computational cost in generating association rules – maximum-length frequent itemsets. Maximum-length frequent itemsets can be useful in many application domains. In this paper, we proposed an algorithm called MAXLEN-FI for mining maximum-length frequent itemsets fast using an array of co-occurrence items. Finally, we presented experimental results on both synthetic and real-life datasets, which showed that the proposed algorithm performed better than the existing algorithms.Trong khai thác dữ liệu, kỹ thuật quan trọng và được nghiên cứu nhiều là khai thác luật kết hợp. Khai thác tập phổ biến là một trong những bước cơ bản và chiếm nhiều thời gian trong khai thác luật kết hợp. Tuy nhiên, trong một số ứng dụng thực tế chỉ cần khai thác tập con đại diện của tập phổ biến với chi phí thời gian thấp để sinh luật kết hợp - tập phổ biến có chiều dài tối đa. Đây là tập hữu ích trong nhiều lĩnh vực ứng dụng thực. Trong bài viết, chúng tôi đề xuất thuật toán MAXLEN-FI khai thác nhanh tập phổ biến có chiều dài tối đa trên dữ liệu giao dịch dựa trên cấu trúc mảng itemset đồng xuất hiện. Sau cùng, chúng tôi trình bày kết quả thực nghiệm trên bộ dữ liệu thực và giả lập, cho thấy thuật toán đề xuất hiệu quả hơn so với thuật toán hiện hành

    Kỹ năng lập trình

    No full text
    388 tr. ; 24 c

    Bài tập cơ sở dữ liệu

    No full text
    176 tr. ; 21 c

    Bài tập cơ sở dữ liệu

    No full text
    176 tr. ; 21 cm

    Bài tập cơ sở dữ liệu

    No full text
    176 tr. ; 21 cm
    corecore